2020年12月,在由《麻省理工科技评论》中国联合DeepTech主办的生命科学创业大赛决赛中,陈曦作为联合创始人兼CEO所创办的呈源生物(RootPath)力压众备受追捧的医药领域硬核技术派公司,斩获了BioFuture of the Year大奖。这家兼具合成生物学和细胞治疗色彩的初创公司也逐渐揭开神秘面纱。本科曾在上海交大电子工程学院和生命学院就读的陈曦,在科研生涯中一直在工程科学与生命科学的交界处寻觅。
“我在做科研的十几年中,一直想在生命科学中寻找一个完全可以通过计算机模拟,准确预测实验结果的子系统。因为准确预测是工程科学的标志。一旦可以准确预测,我们就可以通过计算机在几分钟内完成手工实验几百年、几千年才能做完的事。这是工业革命的核心哲学。”在朝着这一目标的执着追求中,陈曦发现脚下其实是一条创业之路。
陈曦博士 呈源生物/RootPath联合创始人、CEO
01'Don't worry about papers'
2015年,陈曦在哈佛大学Wyss Institute尹鹏实验室即将完成3年的Jane Coffin Childs (JCC)Postdoc Fellowship,很快要对未来的职业发展做出选择。虽然JCC Fellowship是在美国学术界求职的金字招牌,但陈曦似乎早已决定要走另一条路。“我在博士后期、博士后初期那几年,投了很多文章,也审了很多文章。我慢慢感觉到学术界,包括我自己,所追求的创新性有的时候其实很空洞,既没有增进我们对自然的理解,又没有实际应用价值,却偏偏成了论成败的依据。我的导师尹鹏教授很早鼓励我走出发表论文的束缚,到学术界以外,到真实世界中去寻找价值。作为一个当时尚未拿到终身教职的教授能跟自己的博士后说‘don’t worry about papers’,这不仅是极大的无私,而且是极大的智慧。”陈曦回忆说。
彼时,PD-1抑制剂和CAR-T的成功让免疫治疗、细胞治疗成了每个医药行业科研工作者的必修课。在汇聚了George Church、Don Ingber、Jim Collins、Pam Silver、尹鹏这些基因组学和合成生物学宗师的Wyss Institute,陈曦对这些领域的前沿耳熟能详,在大的逻辑上深信这些新的技术能在免疫细胞治疗大展身手,但由于医学知识的局限,并不能清晰地指出一个真正可以解决未被满足的临床需要而且可行的方向。完成博士后研究工作之后,陈曦作为第二位员工,加入了由尹鹏和Illumina的创始人David Walt联合创立,ARCH Venture领投的空间蛋白组学公司Ultivue。“我想去见识一下在美国一流的初创公司是怎样运作的。能在公司成立的第一天就参与到所有方面的运营,这是一个不能错过的机会。在这段时间,通过与大药厂的一些合作项目,我也逐渐对新技术的商业价值、临床价值有了直观的理解,完成了从学术界到工业界的思想转变。”陈曦说到。一年之后,陈曦为了继续拓宽自己的视野,加入了当时刚刚成立的巢生资本(Nest.bio Ventures),为后来成立RootPath埋下了伏笔。
在巢生资本参与投资评估的时候,陈曦接触了很多免疫治疗的项目,诸如溶瘤病毒、CAR-T、TIL等等。在介绍作用机理的时候很多公司都会说,药物造成第一波的肿瘤杀伤之后,死细胞释放的抗原会被DC呈递,刺激其他T细胞识别这些抗原,从而实现第二波、第三波的细胞杀伤。“我不怀疑这个抗原扩散的机理可能存在,但是当我追问到有什么证据证明这一机理的时候,他们都说在当前的技术下无法证明。”换句话说,当人们研究T细胞的时候,很多情况下对T细胞所识别的靶点一无所知。“我们知道少数几个肿瘤相关抗原,比如NY-ESO-1、MAGE、Survivin等。但在肿瘤组织中正在与肿瘤细胞搏斗的,有着成千上万种不同的TCR的T细胞们,它们所识别的抗原分别是什么?人们并不知道。这就意味着,无论是直接改造T细胞的TIL疗法,还是间接影响T细胞的免疫检查点抑制剂、细胞因子,人们在对其进行研究的时候,很大程度上都是在黑暗中射击,shooting in the dark。”怎样才能给这些黑暗中的射击者带来光明?这个问题引起了陈曦的极大兴趣。深入的研究之后陈曦得知,因为TCR的alpha和beta链以及抗体的重链和轻链被两个不同的mRNA编码,高通量获得配对的TCR或抗体序列在当时(2017年)仍是一个未被解决的问题。当时在哈佛、MIT、布罗德研究所的几个实验室中正快速开发的基于微流控的单细胞测序技术有望解决这一问题。随后陈曦与当时尚在布罗德研究所进行博士后研究的丛乐、李寅青,MIT生物工程系Darrel Irvine实验室的Ely Porter,以及耶鲁大学陈列平实验室的王俊进行了多次头脑风暴,探讨这一方向的技术可行性和商业路径。然而即便这项研究取得成功,TCR、抗体配对测序只解决了一半的问题。用陈曦的话说,即便拿到了配对的TCR序列,人们能获得的信息也只是电脑屏幕上的两条字符串而已。至于这个TCR序列是否识别肿瘤,是否识别新抗原,人们依然无从而知。解决另一半问题,需要的是高通量、低成本的基因合成。基因合成能把屏幕上的字符串变成试管中的DNA分子,这样人们才能把待研究的TCR基因放到T细胞中,鉴定它的功能。一个TCR或者抗体序列,除去恒定区以外,有1kb左右的长度。合成这个长度的基因成本在100美金左右。“在当时我们预计高通量的TCR配对测序在一个实验中至少可以产生1,000到10,000条配对的TCR序列。按照当时的成本,合成所有这些TCR需要上百万美金。这对很多应用来说是不现实的。所以除了单细胞测序之外,我们还需要把基因合成的成本降低10到100倍。”
相比于单细胞测序,这个目标听起来更加天方夜谭。毕竟降低基因合成的成本是IDT,Thermo Fisher等一众成熟的大公司以及Twist这样的明星公司积极追求的目标。十几年来虽然不断有渐进的进展,但一直未取得成本的断崖式下降。但陈曦觉得这并不是不可能完成的任务。“我在做科研的十几年中,一直想在生命科学中寻找一个完全可以通过计算机模拟,准确预测实验结果的子系统。因为准确预测是工程科学的标志。一旦可以准确预测,我们就可以通过计算机在几分钟内完成手工实验几百年、几千年才能做完的事。这是工业革命的核心哲学。我读博士的University of Texas at Austin化学系的教学中有着相当深厚的定量、物理化学的传统,给我打下了很多热力学、动力学的基础。但在当时,无论是蛋白折叠,小分子虚拟筛选,系统生物学,都远远达不到准确预测的程度。不过我慢慢发现,DNA、RNA的折叠和杂交这一个子系统已经离准确预测很近了。相比于蛋白折叠中要考虑的无数自由度和能量参数,核酸系统中的自由度少了很多,而且只有几十个能量参数需要实验测量,并且这其中的绝大多数都已经被测量过了。”多年的研究让陈曦对如何定量预测、设计基于核酸杂交、折叠体系积累了一套从第一性原理出发的,自成一派的算法,也通过一些“玩具系统”证明了这套算法的准确性。比如,2013年陈曦以通讯作者的身份在Nature Chemistry上发表的封面文章,证明了基于核酸杂交和折叠的回路可以完成简单的图像处理。 (陈曦以通讯作者身份发表的 Nature Chemistry 封面文章)
在真实世界中,这套算法有着更大的应用价值。很多当代分子生物学的基础技术都是基于核酸杂交和折叠的,如PCR、微阵列、捕获探针杂交等等。经过不断的改进和修正,到了2017年,陈曦已经有信心在计算机中准确预测几乎所有这些反应的行为。很多需要无数次实验迭代的序列设计,都可以在几天内计算完成。后续只需根据具体情况调整一些实验参数(如温度、探针浓度、酶浓度)即可。经过几个月的研究论证之后,陈曦和新近全职加入巢生资本的Ely Porter确定了几条成功率比较高的技术路线,并获得了巢生资本提供的启动资金。2017年5月,RootPath在巢生资本波士顿办公室的一个旧会议室改装成的简陋实验室里正式开张。2018年,他们获得了单细胞测序方向上一些重要的概念验证数据,并得到了红杉资本、火山石资本、百度风投的支持,完成了700万美元的种子轮融资。利用这笔融资,RootPath在先前设定的几种技术路线上,尤其是单细胞操作技术上,都取得了突破。
然而,英雄所见略同:单细胞测序的龙头企业10X Genomics,虽然此前一直局限在无法应用到TCR和抗体测序的mRNA 3'端测序,但在2019年推出了单细胞TCR和抗体测序的试剂盒。对于陈曦来说,这反而是一个好消息。“我们在那个时候虽然几个方向进展都不错,包括一种可以绕过测序和合成的,在微液滴里直接连接TCR alpha链和beta链的组装技术,但我们可以明显看出一个苗头,就是我们在基因合成方面能够做出的突破是更有革命性的。如果业界可以广泛采用10X的试剂盒,会有很多的人获得大量的TCR序列,但无法进行功能性的分析。这就迅速扩大了对高通量、低成本TCR基因合成的需求。10X的突破让我们可以更专注地开发TCR基因合成技术。”2019年底,在高通量TCR基因合成进入最后调试阶段的时候,RootPath获得了经纬中国、元禾原点的青睐,完成了1100万美元的A轮融资。事实证明,10X的成功确实让整个免疫研究领域对高通量、低成本TCR合成技术产生了如饥似渴的需求。在2020年多家一流的研究机构和药企找到了RootPath并与之签订了合作协议。近日,RootPath又完成了由鼎晖投资、云九资本共同领投的近5000万美元的B轮融资。RootPath的高通量、低成本基因合成技术不光可以应用在TCR上,而且可以应用到任意序列的基因上。基因合成业务本身就可以支撑一家成功的上市公司。毕竟Twist凭着基因合成业务,已经在2018年登陆纳斯达克,目前市值约60亿美金。RootPath可以做到比Twist低10倍的成本,有望在基因合成领域大有作为。但RootPath并不满足于成为一个提供基因合成服务的CRO。陈曦认为高通量TCR合成可以直接转化成与众不同的完全个体化TCR-T疗法。所谓“完全个体化”,指的是不光成药的T细胞来自病人本身(常见的CAR-T就是这种情况),而且用来工程化改造T细胞的TCR序列也来自病人自己。美国的PACT Pharma,荷兰的Neogene都是率先开发完全个体化TCR-T疗法的公司。
这一思路可以追溯到TIL疗法。TIL疗法依靠的是把病人肿瘤组织中的T细胞在体外高度扩增之后再给病人回输。这一疗法在黑色素瘤的治疗中取得了亮眼的效果,Iovance的TIL疗法lifileucel(LN-144)也在FDA批准的边缘。然而对于更常见的癌症,传统TIL的治疗效果就不那么突出了。据陈曦分析,这里一个很重要的原因就是TIL中真正识别肿瘤的T细胞可能只占所有肿瘤浸润T细胞的百分之几,或者百分之零点几,而且往往处于高度耗竭状态,这些细胞在体外扩增过程中的增殖速度很慢,甚至完全不增殖。所以回输给病人的细胞中可能几乎全是‘旁观者T细胞’。
(在2019年自然-医学的一篇的文章中,来自荷兰Ton Schumacher实验室的研究者从一名结直肠癌(CRC)患者的TIL中随机克隆了19个高频TCR,但发现无一是可以识别病人自身的肿瘤的。一名卵巢癌(OVC)患者中的20个高频TCR只有一个是肿瘤识别性的。这提示必须筛选更多的TCR才能有把握地找到肿瘤反应性TCR。doi: 10.1038/s41591-018-0266-5)
那么如果我们能把这些肿瘤识别性的TCR找出,再用生产TCR-T的方法用其改造病人外周血的T细胞,是不是就能解决上述问题了呢?这正是完全个体化TCR-T治疗的思路。如今,从肿瘤病人的外周血或者肿瘤组织中获得成千上万的TCR序列已经不难。但选择哪些TCR去制备TCR-T仍是一个悬而未决的问题。在10X的试剂盒普及之后,人们可以把从肿瘤组织中获得的,未经扩增的TIL进行单细胞测序,得知每个T细胞的序列和表达谱的状态。国内外的很多学者都提出,我们或许可以通过TCR的扩增状态或者携带这个TCR的T细胞的激活、耗竭情况预测TCR是否是识别肿瘤的。然而在陈曦看来这样的预测未必是准确的。“这种预测基于的是某种假说:‘被扩增的TCR就是识别肿瘤的’,或者‘表达某一组基因的T细胞中的TCR就是识别肿瘤的’。在开发一个疗法的时候,假说越多,风险就越高。我们要么需要摆脱这一假说,要么需要在大量投入临床资源之前对这些假说证实或证伪。”无论哪一种选择,都需要对大量的TCR进行合成和筛选。有了高通量、低成本TCR合成这一独门绝技,陈曦相信RootPath会在众多尝试完全个体化TCR-T的公司当中脱颖而出。要摆脱假说,需要的是去合成测序获得的成千上万的TCR,之后把它们放进T细胞中,并与肿瘤细胞或者携带了肿瘤抗原的抗原呈递细胞共培养。如果哪个TCR是真正识别肿瘤的,那么携带这个TCR的T细胞便会被激活。这些被激活的细胞可以被挑选出来,以确定其所携带的肿瘤识别性TCR的序列。整个过程需要在一两个月之内,在病人可以承受的成本下进行。要证明某些假说是对的,就必须针对很多样本,合成不同假说所对应的TCR亚群,进行类似的实验。两者都对TCR合成成本有着极其苛刻的要求。所以被问到为什么要选择完全个体化TCR-T作为RootPath的第一个临床应用时,陈曦回答说:“我觉得不是我们选择了完全个体化TCR-T,而是完全个体化TCR-T选择了我们。”对于完全个体化TCR疗法的复杂过程和昂贵费用,陈曦也直言不讳。“这个过程确实很复杂。但只要一个疗法安全有效,复杂性从来都不是不可逾越的鸿沟。30年前我们认为抗体药太复杂了,20年前我们认为CAR-T太复杂了,但我们都通过工程化的手段解决了。人们怕的其实是不是复杂性,而是不确定性,只是有时在潜意识里会把两者等同。我们能对每一个TCR进行功能性表征,确认其肿瘤识别性,正是去除了很多的不确定性。成本也是会随着过程自动化和产业链上下游的竞争迅速下降的。” 但与此同时RootPath也有一个巧妙的策略快速开发相对低成本的通用型TCR-T疗法。
04寻找通用型TCR:
Ask biology. Don't ask biologists.
当RootPath发现可以识别一个病人的肿瘤的TCR的时候之后,都会用一系列成熟的实验流程判断这个TCR是否对别的病人也是安全有效的。如果是的话,这个TCR就自动成为了通用型TCR候选者,是可以迅速进入IND的资产。“我们现在从病人的肿瘤中找到了一些可以识别HLA匹配的细胞系的TCR。这就说明这些TCR的靶点不光在这个病人中存在,也在细胞系中存在。这就提示我们它很可能在很多病人的肿瘤中都存在。我们目前正在用一些成熟的技术寻找这些TCR的靶点。一旦找到,这个TCR就是一个通用型TCR的候选者。”目前绝大多数的通用型TCR-T企业都是从已知抗原出发(如NY-ESO-1, MAGE-A4,HPV E6/E7,KRAS mutation等),去寻找识别这些抗原的TCR。RootPath的思路是反其道而行之:先找到有功能的TCR,再去找它的靶点。
陈曦认为这是RootPath能驶向细胞治疗蓝海的重要动力:“我们为什么要被现有的那几个靶点束缚呢?斯坦福大学的 Irving Weissman 教授有一句名言:‘If you have a question about biology, ask biology. Don't ask biologists.’ 我们这些biologists对肿瘤免疫的认识是很片面的。哪些抗原的肿瘤特异性强,哪些抗原的呈递效率高,哪些抗原的免疫原性高,等等这些问题,整个免疫学届至今理解得都非常肤浅。每隔几个月就会有一些新的文章发表出来颠覆我们的认知。我们的策略是直接对biology,对肿瘤微环境发问:你们这些T细胞哪些可以识别肿瘤?识别的靶点到底是什么?我们需要用它们听得懂的语言发问。这门语言的一个重要组成部分就是TCR基因的序列。承载这个语言的载体,就是通过高通量合成获得的DNA分子。”RootPath这一寻找通用型TCR的方法还有另外一个重要的优势,就是从根本上保证了TCR的亲和力。在传统的TCR开发过程中,人们会用负载大量抗原多肽的抗原呈递细胞刺激T细胞,使抗原识别性的T细胞扩增。然而在这个人工环境中,因为抗原密度过高,很多亲和力很弱的T细胞克隆也能迅速扩增甚至成为比例最高的克隆。但癌细胞内源表达的抗原在细胞表面的密度是非常低的,这就导致即便癌细胞表达了抗原,这些低亲和力TCR仍然无法识别癌细胞。这使得很多TCR-T公司需要进行人工亲和力优化。这一过程不仅成功率不能保证,而且有着脱靶的安全性风险。Adaptimmune曾经开发的一个针对MAGE-A3的TCR,就是因为人工亲和力优化之后脱靶识别了心肌细胞中表达的Titin,而造成了致命的心脏毒性。然而,在RootPath的开发过程中,每个进入靶点研究的TCR都已经展示了识别HLA匹配的细胞系的能力。也就是说无论它的靶点是什么,这个靶点都是由细胞系内源表达的。这就从源头上保证了TCR的亲和力。近年来,国际药企对通用型TCR的认可程度与日俱增。近日,Adaptimmune和Roche针对5个通用型TCR,达成了1.5亿美元首付款,总价值30亿美元的合作。最近四年里,通用型TCR领域中的授权和合作开发协议总价值已经超过了100亿“生物美元”('bio-dollars'),每个TCR所对应的首付款和总价值也在不断提升。有理由相信,无论是为了license-out还是内部研发,RootPath的TCR发现引擎都可以带来丰富的研发管线。
(近年来通用型TCR领域的合作)
“我们花了4年的时间,从核酸杂交、折叠的第一性原理出发,建立了这样一套在世界上独一无二的高通量、低成本TCR合成、筛选的流程。它正在像一个生产流水线一样给我们带来一个又一个的个体化和通用型的TCR,也给患者带来了希望。我觉得这是合成生物学为真实世界带来价值的一个完美案例。”陈曦最后说到。